توسعه کنترلر هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک
نویسندگان
چکیده مقاله:
افزایش روزافزون تعداد خودروها و در پی آن ترافیکهای سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را بهخوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغهای راهنمایی بر پایه یادگیری تقویتی است. کنترل هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی نیاز به یادگیری و تصمیمگیری در فضای حالت بزرگ (پیوسته) را دارد. همین امر باعث میشود که روشهای رایج یادگیری تقویتی (حالت گسسته) برای چنین مسائلی (با فضای حالت بزرگ) بهخوبی قابل بسط نباشند. هدف تحقیق حاضر حل این چالش در مسئله کنترل ترافیک میکروسکوپیک است. در همین راستا نوآوری تحقیق حاضر را میتوان توسعه کنترلر هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی حالت پیوسته برای حل چالش بزرگ بودن فضای حالت برشمرد. یادگیری تقویتی حالت پیوسته از شباهت سنجی حالات برای تخمین ارزش آنها استفاده میکند. در این تحقیق بهمنظور اعتبار سنجی، دو روش یادگیری Q و عملگر-نقاد حالت گسسته نیز پیادهسازی و عملکرد آنها با روش پیشنهادی مقایسه شدند. نتایج نشان میدهند که روش پیشنهادی منجر به کاهش 16% و 13% زمان سفر در مقایسه با دو روش عملگر-نقاد و یادگیری Q میشود.
منابع مشابه
توسعه سامانههای چند عامله و یادگیری تقویتی در کنترل هوشمند چراغهای راهنمایی
امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیبهای مختلف اقتصادی، محیط زیستی و اجتماعی میشود. برای جلوگیری از این آسیبها، نیاز به بهبود زیر ساختهای فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس میشود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغهای راهنمایی به عنوان یکی از شاخههای سیستمهای حمل و نقل هوشمند با استفاده از سامانههای چند عامله یادگی...
متن کاملتحلیل و بررسی اثرات ترافیکی و زیست محیطی چراغ های هوشمند و چراغهای غیر هوشمند در تقاطع ها
سیستم SCATS یکی از سیستمهای کنترل هوشمند ترافیک است که توسط کامپیوتر مرکز و با دریافت اطلاعات از شناسگرها، فرمان زمان بندی چراغ تقاطع های یک شبکه را صادر می کند. این سیستم در بسیاری از شهرهای بزرگ و برتر در جهان از جمله تهران به کار رفته است. هدف این گزارش ارایه روشی برای ارزیابی کارآیی این سیستم در تهران است. تاکنون در شهرهای مختلف با روشهای گوناگونی، عملکرد شبکه حمل و نقل شهری را قبل و بعد از...
متن کاملتوسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله
در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...
15 صفحه اولترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات
استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...
15 صفحه اولیادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک
در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...
متن کاملکنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتمهای یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی)
یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریانهای ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساختهایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 11 شماره 2
صفحات 9- 21
تاریخ انتشار 2017-09
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023